FILTER MODE ACTIVE

#мультимодальная модель

Найдено записей: 8

#мультимодальная модель18.11.2025

Gemini 3 Pro от Google: Sparse MoE и контекст на 1M токенов для практичных мультимодальных агентов

'Google представил Gemini 3 Pro, мультимодальную модель со sparse MoE и окном контекста на 1 млн токенов для задач рассуждения, кода и агентных рабочих процессов.'

ЧИТАТЬ →

#мультимодальная модель25.08.2025

SEA-LION v4: мультимодальная эффективная модель для языков Юго-Восточной Азии

'SEA-LION v4 — 27B мультимодальная модель, ориентированная на языки Юго-Восточной Азии; сочетает высокую точность на SEA-HELM с возможностью запуска на обычном железе.'

ЧИТАТЬ →

#мультимодальная модель18.08.2025

Ovis 2.5: мульти-модальные LLM от Alibaba с нативным разрешением и улучшённым визуальным мышлением

'Ovis2.5 (9B и 2B) от Alibaba улучшает визуальное восприятие и мультимодальное рассуждение с помощью NaViT и опционального режима размышления, достигая топ-результатов среди открытых моделей ниже 40B.'

ЧИТАТЬ →

#мультимодальная модель12.08.2025

Zhipu AI представила GLM-4.5V: открытая мультимодальная модель с контекстом 64К и режимом Thinking Mode

'GLM-4.5V от Zhipu AI — открытая мультимодальная модель с 106B параметрами в фоне и 12B активных параметров, поддержкой 64К токенов и режимом Thinking Mode для сложного визуально-текстового анализа.'

ЧИТАТЬ →

#мультимодальная модель04.08.2025

NASA Представляет Galileo: Революционная Открытая Мультимодальная Модель для Дистанционного Зондирования Земли

NASA представила Galileo — открытую мультимодальную модель ИИ, которая интегрирует разнообразные данные дистанционного зондирования для задач сельского хозяйства и реагирования на чрезвычайные ситуации.

ЧИТАТЬ →

#мультимодальная модель27.06.2025

Google представляет Gemma 3n: компактная мультимодальная модель ИИ для устройств на периферии

Google представил Gemma 3n — компактную мультимодальную модель ИИ, оптимизированную для эффективной работы на периферийных устройствах, обеспечивающую обработку текста, изображений, аудио и видео в реальном времени.

ЧИТАТЬ →

#мультимодальная модель25.06.2025

ByteDance представляет VGR: продвинутая мультимодальная модель с улучшенным визуальным рассуждением

ByteDance представила VGR — мультимодальную модель, которая динамически интегрирует визуальную информацию в процесс рассуждения, значительно улучшая точность и эффективность на бенчмарках зрения и языка.

ЧИТАТЬ →

#мультимодальная модель16.05.2025

Salesforce Представляет BLIP3-o: Открытая Унифицированная Мультимодальная Модель с CLIP Эмбеддингами и Flow Matching для Понимания и Генерации Изображений

Salesforce выпустила BLIP3-o — открытую мультимодальную модель, объединяющую понимание и генерацию изображений с помощью CLIP эмбеддингов и Flow Matching, демонстрируя передовые результаты.

ЧИТАТЬ →